day8 LangChain RAG：資料庫建置到檢索生成解析

16th鐵人賽 langchain rag llm information retrieval

1128 瀏覽

前言

昨天我們進行RAG的介紹、使用RAG的步驟與優劣勢，那麼今天我們將會介紹我們在LangChain使用RAG的詳細步驟，畢竟會需要外部資料源，我們之後會從資料的部分開始進行說明。

分割：文字分割器將大文字分割Documents成更小的文字區塊，傳遞到模型會很有用，因為大塊更難搜尋並且不適合模型的上下文的檢索，另外過小的話，對於輸出的品質會有明顯的斷詞錯誤，要考慮適當的切割大小。

轉成向量後，同樣保持著原本的語意資訊，並且使用者進行查詢後，將使用者查詢轉成向量，可以直接在向量資料庫中進行語意相似度分析，若都是純文字，則進行關鍵字比對，向量更高效之外，也更加精準。

明天我們會先以網頁當作第一個資料源，並且使用Chroma開源的免費向量資料庫，並且進行RAG的示範案例

系列文

8 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

立即登入留言

IT邦幫忙